home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / infosrvr / doc / www_talk.arc / 000074_timbl _Thu Mar 26 15:25:12 1992.msg < prev    next >
Internet Message Format  |  1992-11-30  |  3KB

  1. Return-Path: <timbl>
  2. Received: by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  3.     id AA23337; Thu, 26 Mar 92 15:25:12 GMT+0100
  4. Date: Thu, 26 Mar 92 15:25:12 GMT+0100
  5. From: timbl (Tim Berners-Lee)
  6. Message-Id: <9203261425.AA23337@ nxoc01.cern.ch >
  7. Received: by NeXT Mailer (1.62)
  8. To: Jonny Goldman <jonathan@think.com>
  9. Subject: Openning the WAIS document-id syntax
  10. Cc: www-talk@nxoc01.cern.ch, wais-talk@think.com
  11.  
  12. > Date: Tue, 24 Mar 92 09:46:21 PST
  13. > From: Jonny Goldman <jonathan@think.com>
  14.  
  15. Jonny,
  16.  
  17. This is relevant to the WAIS-FTP work Jim is doing.
  18.  
  19. Unfortunately none of the WAIS crowd could get to discussions at the IETF -- though  
  20. John Curran represented the WAIS side. Those discussions were very interesting. 
  21.  
  22.  
  23. The data model of WAIS (documents in databases) could be deconstrained to allow  
  24. documents themselves to be or contain lists of documents, and for lists of  
  25. documents to point to things other than documents in the same database.
  26.  
  27. This is the way the second part can work.  Normally, a search returns a list of  
  28. doc-ids, each one (basically) like
  29.  
  30.     /usr/local/lib/wais/mydatabase/fred/myfile.txt
  31.  
  32. which is in fact a filename. There's a load of other stuff in there which we can  
  33. ignore for now.  What a WAIS search needs to be able to do, when you are pointing
  34. to files, is to return a pointer to a file in FTP say. We do that in two steps.
  35. First, we recognise that that id is local to the conext of a wais server on host  
  36. myhost and port myport. When the server returns that string, the client
  37. uses knowledge of the context in which it was quoted to exapnd that to
  38.  
  39.     wais://myhost.dom.net:myport/usr/local/lib/wais/mydatabase/fred/myfile.txt
  40.  
  41. This is a refernece you can quote to anyone as it makes sense anywhere. No context.
  42. I called it a UDI but we'll have to change the name. Document Access Token maybe.
  43. It's like Brewster's proposal but extendable to other protocols.  [Yes, WAIS is a  
  44. good protocol but there are others. Including name servers and directories which  
  45. will be needed for long-lived but movable documents.]
  46.  
  47. Now suppose one day a server returns a doc-id INCLUDING the protocol, host, etc.  
  48. For example, your WAIS FTP engine (like the ARCHIE WAIS) returns what are basically
  49. pointers to files. Just now, because of the constraints of the model, it has to  
  50. return a part of a file within the database. Suppose we change that, so that
  51. in your case it just returns a doc-id which specifies anonymous ftp access, like:
  52.  
  53.     file://otherhost.com/pub/doc/mydoc.txt
  54.  
  55. The client has a general retrieval engine which can accept doc-ids in many domains  
  56. -- not just WAIS. That allows it to go out over a different protocol to retrieve  
  57. the object.
  58.  
  59. This is the way WWW and Gopher work.  They are open systems -- you can link into
  60. any other system within reason.  That's why the fuss about universal document  
  61. identifiers.  Maybe the WAIS people would to incorporate them -- that is, just
  62. make sure that the normal WAIS server return things which are -- like the one
  63. above -- special cases of the more general syntax.
  64.  
  65. I haven't had much comment from the WAIS side about the UDIs, but I'd like to have  
  66. some. (file://info.cern.ch/pub/www/doc/udi1.ps was background for the IETF  
  67. discussions.) We plan a small working group hacking out the details before an RFC  
  68. is submitted.
  69.  
  70.  
  71. > I like the idea of generalized interfaces, customized servers.
  72.  
  73. You bet!
  74.  
  75.  
  76. - Tim BL
  77.